2025-04-132025-04-13 随手记 3 分钟读完 (大约473个字) 0次访问

DCMT 模型

整体的目标公式是 :-> $L(\theta)=\mathcal{E}^{\mathrm{CTR}}+w^{c v r} \mathcal{E}^{\mathrm{DCMT}}+w^{c t c v r} \mathcal{E}^{\mathrm{CTCVR}}+\lambda_2\|\theta\|_F^2$
特征划分成wide和deep两部分，分别得到对应的wide embedding和deep embedding

主任务CVR task

#card 事实转化率 + 反事实转化率公式： $\left\langle\hat{r}_{i, j}, \hat{r}_{i, j}^*\right\rangle=\left\langle\sigma\left(l_f\right), \sigma\left(l_{c f}\right)\right\rangle$ $⟨ \overset{r}{^}_{i, j}, \overset{r}{^}_{i, j}^{*} ⟩ = ⟨ σ (l_{f}), σ (l_{c f}) ⟩$

=<\sigma\left(l_f^w+l_fd\right), \sigma\left(l_{c f}^w+l_{c f}^d\right)> \
=<\sigma\left(\phi\left(\vec{x}{i, j}^w ; \theta_f^w\right)+\psi\left(\vec{x}{i, j}^d ; \theta^d, \theta_f^d\right)\right), \sigma\left(\phi\left(\vec{x}{i, j}^w ; \theta{c f}^w\right)+\psi\left(\vec{x}{i, j}^d ; \theta^d, \theta{c f}^d\right)\right)>
\end{gathered}

+ 这里的 $\sigma(*)$ 是Sigmoid函数，$\phi(\vec{x}, \theta)$ 是线性回归函数，$\psi(\vec{x}, \theta)$ 则对应的MLP结构。具体的 $\theta$ 已经在图中标清楚了。除了根据wide embedding $\vec{x}_{i, j}^w$ 和deep embedding $\vec{x}_{i, j}^d$ 分别用线性和深度结构来处理，这其实就是一个双子塔结构。这个双子塔的输入是一样的，即 $\vec{x}_{i, j}^w+\vec{x}_{i, j}^d$ ，但是输出则是两个，分别对应事实CVR（factual CVR）$\hat{r}_{i, j}$ 和反事实CVR （counterfactual CVR）$\hat{r}_{i, j}^*$ 。 + 这样的双子结构其实可以很好地模拟用户做转化决策的过程。面对同样的输入特征 $x_{i, j}$ ，样本有一定的概率 $\hat{r}_{i, j}$ 进入事实空间，有一定概率 $\hat{r}_{i, j}^*$ 进入反事实样本空间。而我们模型中，加入了一个软性约束（先验知识） $\hat{r}_{i, j}+\hat{r}_{i, j}^* \approx 1$ 来控制这两个CVR的预测值。

DCMT 模型

https://blog.xiang578.com/post/logseq/DCMT 模型.html

作者

Ryen Xiang

发布于

2025-04-13

更新于

2025-04-13

DCMT 模型

作者

发布于

更新于

许可协议

网络回响

评论

最新文章